Pengecaman aksara optik atau
pembaca aksara optik (
OCR,
Bahasa Inggeris: optical character recognition atau optical character reader) ialah penukaran
elektronik atau
mekanikal imej teks yang ditaip, ditulis tangan atau dicetak kepada teks terkod mesin, sama ada dari dokumen terimbas, foto suatu dokumen, foto pemandangan (contohnya teks pada papan tanda dan papan iklan dalam foto landskap) atau dari teks sari kata tertindih pada suatu imej (contohnya: dari siaran televisyen).
[1]Luas digunakan sebagai bentuk
kemasukan data dari rekod data kertas tercetak – sama ada dokumen pasport, invois,
penyata bank, resit berkomputer, kad perniagaan, surat, cetakan data statik, atau mana-mana pendokumenan yang sesuai – ia merupakan kaedah yang umum dalam pendigitan teks tercetak agar ia boleh disunting secara elektronik, dicari, disimpan dengan lebih padat, dipapar pada baris, dan digunakan dalam proses mesin seperti
pengkomputan kognitif,
terjemahan mesin,
teks-ke-tutur (tersari), data utama dan
perlombongan teks. OCR ialah bidang penyelidikan dalam
pengecamn corak,
kecerdasan buatan dan
penglihatan komputer.Versi awal perlu dilatih dengan imej setiap aksara, dan berfungsi pada satu fon pada satu masa. Sistem lanjutan berupaya menghasilkan darjah tinggi kejituan pengecaman bagi kebanyakan fon yang kini umum, dan dengan sokongan untuk pelbagai input format fail imej digital.
[2] Beberapa sistem berupaya menerbit semula output terformat yang hampir dekat dengan halaman asal termasuk imej, lajur, dan komponen bukan teks yang lain.